[Home] Python으로 돌아가기

[박주민][파이썬과 아두이노] 8. 데이터 결측치 및 정렬

[YouTube]

https://www.youtube.com/watch?v=uoVgBnBrE5I

[Code]

8.결측치.py [Download]

[데이터] 지역 데이터.xlsx [Data Source]

[예제 코드 1] 결측치 확인 및 수정


import pandas as pd
df = pd.read_excel('지역 데이터.xlsx')

# 행열 옵션 설정
pd.set_option('display.max_rows', 1000)
pd.set_option('display.max_columns', 20)

# 인덱스 순서 지정
new_index = [str(i) for i in range(1, len(df) + 1)]
df.index = new_index

# 결측치 처리
df['위치'].fillna('발생안함', inplace=True)
df.loc[:, '규모':'위치'] = df.loc[:, '규모':'위치'].fillna('확인중').astype(str)
df.dropna(inplace=True)
    

[예제 코드 2] 데이터 정렬


# 오름차순 정렬
df.sort_values('평균기온(°C)')

# 내림차순 정렬
df.sort_values('평균기온(°C)', ascending=False)

# 다중 컬럼 정렬
df.sort_values(['평균기온(°C)','월합강수량(00~24h만)(mm)'], ascending=[True, False], inplace=True)
    

[예제 코드 3] 데이터 수정 및 추가


# 특정 데이터 값 수정
df['지역'].replace({'경기도(이천)':'경기도','충청남도(천안)':'충청남도'}, inplace=True)

# 컬럼 추가
df['총합'] = df['평균상대습도(%)'] + df['월합강수량(00~24h만)(mm)']
df['결과'] = 'Fail'
df.loc[df['총합'] > 100, '결과'] = 'Pass'
    

[예제 코드 4] 그룹화


# 특정 그룹 출력
df.groupby('지역').get_group('충청북도(청주)')

# 데이터 평균
df.groupby('지역').mean()
    

[추가 자료]

추가 자료